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REMARKS 

Applicant wishes to thank Examiner Lucas and Interference Specialist Helms for the 
courtesy extended to Nancy Vensko, attorney of record, on April 10, 2006. The Interview 
Summary Form PTOL-413 summarizes the discussion held at the personal interview. The 
present response to the outstanding Office Action includes the substance of the Examiner 
Interview. 

A. Disposition of Claims 

Claims 1-8 and 1 1-18 are pending in this application. Claims 9, 10, and 19-40 have been 
canceled without prejudice as being drawn to non-elected subject matter. The claims have been 
amended so that application of the two-way test leads to the determination that USP 6,627,437 to 
Traboni and the claims of the present application do not define the same patentable invention. 
Additionally, Claims 6-8 and 11-14 have been edited to add "isolated" to define patentable 
subject matter as opposed to products of nature and to avoid accidental anticipation by Simons et 
al., Proc Natl Acad Sci USA 92: 3401, 1995. Support for the amendment is found throughout the 
specification, for example, at Table 1 and page 27, last sentence ("last 259 nucleotides"), and at 
page 16, lines 20-23 ("isolated"). No new matter has been added. Reexamination and 
reconsideration of the application, as amended, are respectfully requested. 

B. Compliance with Rules regarding Nucleotide and/or Amino Acid Sequence Disclosures 
in Patent Applications 

The specification has been amended to add sequence identifiers, and a new sequence 
listing in paper and computer readable form (CRF) submitted to conform thereto. Table 1 has 
been substituted with a replacement Table 1 to correct two typographical errors. The first is at 
position 2566 (should be T C C not T-^T-T). The second is at position 9061 (should be 9061 not 
9067). Support for the amendment is found throughout the specification, for example, at original 
Table 1. This is because Table 1 illustrates the points of difference among GBV-B, GBV-B, 
2/94, and pGBB. Table 1 explains that the sequence of GBV-B is that of Simons et al. 1995, of 
record, which gives the GenBank accession no. as U22304; the sequence of GBV-B, 2/94 is that 
of an intermediate clone; and the sequence of pGBB is that of the infectious clone, which is SEQ 
ID NO: 1. Exhibit 1 is a sequence alignment of SEQ ID NO: 1 and GenBank accession no. 
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U22304. Exhibit 1 illustrates that position 2566 is C in the infectious clone, pGBB, not T, as in 
Simons et al. 1995. Additionally, Exhibit 1 illustrates that the position in the 3'UTR at which the 
infectious clone, pGBB, differs from Simons et al. 1995 by having a C, not T, is at position 9061, 
not 9067. Finally, Table 1 explains that the sequence of the intermediate clone, GBV-B, 2/94, is 
identical to that of the infectious clone, pGBB, except at the positions marked by an asterisk, thus 
we can deduce that positions 2566 and 9061 are identical for these two clones. In sum, the 
correction of the typographical errors in Table 1 does not introduce new matter as illustrated by 
sequence alignment of the infectious clone, pGBB, and Simons et al. 1995. (Please be notified 
that SEQ ID NO: 3 is identical to SEQ ID NO: 1 except for missing the last 259 nucleotides to 
illustrate the critical point of difference between the prior art and the infectious clone.) Finally, 
the correction of the typographical errors conforms Table 1 of the specification to the post-filing 
date inventor-created art of Bukh et al., Virology 262: 470, 1999, of record, at Table 1. 

C. Compliance with 35 USC 101 

The issue is whether Claims 6-8 and 11-14 are in compliance with 35 USC 101. These 
claims have been edited to add "isolated" to define patentable subject matter as opposed to 
products of nature. The conclusion is that the claims are in compliance with 35 USC 101. 

D. Compliance with 35 USC 112/1 

The issue is whether Claims 1, 4, 6-9, 11-13, and 15-17 are in compliance with 35 USC 
112/1 as meeting the written description requirement. The claims have been amended so that 
application of the two-way test leads to the determination that USP 6,627,437 to Traboni and the 
claims of the present application do not define the same patentable invention. Comparing NIH 
(the present Applicant) and Traboni, the claims of the present application are directed to a 
species falling with the genus of Traboni in which NIH's 3'UTR is encoded by the last 259 
nucleotides of SEQ ID NO: 1. Otherwise, for both Traboni and the present application, the 
remainder of the full-length clone is defined with reference to a GB virus-B that is infectious. 
Traboni is presumed to be valid. The 259 nucleotide 3 '-end is identified in the present 
application as being required for infectivity and as solving the problem in the prior art of the lack 
of an infectious clone. The conclusion is that the claims of the present application, which are 
directed to a species falling within the genus of Traboni are in compliance with 35 USC 112/1. 
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E. Compliance with 35 USC 102(b) 

The issue is whether Claims 8 and 11-13 are in compliance with 35 USC 102(b) or 
anticipated by Simons et al. 1995. The rule according to MPEP 2131 is that to anticipate a claim, 
the reference must teach every element of the claim. These claims have been edited to add 
"isolated" to avoid accidental anticipation by Simons et al. 1995. Simons et al. 1995 describes 
the non-infectious clone of the prior art missing the last 259 nucleotides. Simons et al. 1995 
isolated the clone by converting nucleic acids extracted from preinoculation plasma or infectious 
plasma obtained from a GB-infected animal to double-stranded DNA by randomly primed RT 
and randomly primed second strand synthesis (Simon et al. 1995, p. 3402, col. 1, 1 st If of 
Results). The GB virus was not "isolated" just because it was found in plasma from a tamarin 
infected with the GB agent. The blood may have been separated to produce plasma. But the GB 
virus by itself was not isolated. Turning to the RNA, it was characterized and turned out to be 
missing the last 259 nucleotides. Ending with the host cell, it was not "isolated" either just 
because it was found in plasma from a tamarin infected with the GB agent. To reiterate, the 
blood may have been separated to produce plasma. But the host cell per se was not isolated. 
Please be informed that isolated RNA and host cells were patented in Traboni. Traboni is 
presumed to be valid. The conclusion is that Simons et al. 1995 fails to anticipate the claims, 
thus the claims are in compliance with 35 USC 102(b). 

F. Separate Patentable Invention under 35 USC 102fg) 

The issue is whether the claims define a separate patentable invention under 35 USC 
102(g) or conflict with USP 6,627,437 to Traboni. The rule according to Eli Lilly & Co. v. Bd. 
of Regents of the Univ. of Wash ., 67 USPQ2d 1161 (Fed. Cir. 2003) is that the two-way test is 
required for determining whether two parties claim the "same patentable invention". A "separate 
patentable invention" means that the species invention of one party is new and nonobvious in 
view of the genus invention of the other party. Id at p. 1 164. The claims have been amended so 
that application of the two-way test leads to the determination that USP 6,627,437 to Traboni and 
the claims of the present application do not define the same patentable invention. The claims of 
the present application are directed to an isolated nucleic acid molecule which encodes GB virus- 
B having a complete 3'UTR and which is capable of producing infectious virus when transfected 
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into cells in vivo, wherein the 3'UTR is encoded by the last 259 nucleotides of SEP ID NO: 1 . 
USP 6,627,437 to Traboni describes a genus in which the 3'UTR is encoded by SEQ ID NO: 1 
(the last 309 nucleotides of the full length clone), or SEQ ID NO: 2 (the last 259 nucleotides of 
the full length clone), and variations thereof having no more than 10 alterations and provided that 
each of said alterations is a substitution, addition, or deletion. Comparing NIH (the present 
Applicant) and Traboni, the claims of the present application are directed to a species falling 
within the genus of Traboni in which NIH's 3'UTR is encoded by the last 259 nucleotides of 
SEQ ID NO: 1. Otherwise, for both Traboni and the present application, the remainder of the 
full-length clone is defined with reference to a GB virus-B that is infectious. Exhibit 2 is a 
sequence alignment of the last 259 nucleotides of NIH's SEQ ID NO: 1 and the last 259 
nucleotides of Traboni's SEQ ID NO: 1. Exhibit 2 illustrates that there is one point of difference 
between NIH's and Traboni's sequences. 1 NIH's species is not rendered obvious by Traboni's 
genus considering the size of the genus. Given that Traboni's 3'UTR sequence is encoded by 
259 nucleotides and variations thereof having no more than 10 alterations and provided that each 
of said alterations is a substitution, addition, or deletion, the number of possibilities embraced by 
the Traboni genus is almost infinite. The number of possibilities is estimated by the following 
formula 
10 

3 n 259! 

i — 

n! (259-n)! 

n=l 

that equals on the order of 2 x 10 22 . Absent anything in the prior art suggesting which of the 
almost infinite possibilities embraced by Traboni corresponds to NIH's 3'UTR, the prior art 
would not have suggested the claimed species. Although a genus may be so small that, when 
considered in light of the totality of the circumstances, it would anticipate the claimed species, 
not so here. Remembering that it embraces a number of possibilities that is almost infinite, the 
Traboni genus cannot inherently anticipate the claimed NIH species because one skilled in the art 



1 Please be reminded that U.S. 2004/0039187 to Martin et al. is not prior art in that it claims 
priority back to the same priority date as the present application and, as illustrated in Exhibit 2, 
there is one point of difference between NIH's and Martin et al.'s sequences. 
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would not envisage each member of the genus. Besides the size of the genus, a consideration of 
any teachings of a "typical" of } "preferred" or "optimum" species within the disclosed genus 
reveals that any such teaching is nonexistent. Besides the size of the genus and lack of teachings 
to support the selection of the species, unexpected advantages reside in NIH's clone being fully 
infectious. Refer to specification at Example 3; accord, post-filing date inventor-created art of 
Bukh et al., Virology 262: 470, 1999, of record. Given the size of the genus, the lack of 
teachings to support the selection of the species, and the unexpected advantages, the conclusion 
is that the claims of the present application, which are directed to a species that is new and 
nonobvious in view of USP 6,627,437 to Traboni, define a separate patentable invention under 
35 USC 102(g). No interference-in-fact exists. 



In view of the above, it is submitted that the claims are in condition for allowance. 
Reconsideration and withdrawal of all outstanding rejections are respectfully requested. Allowance 
of the claims at an early date is solicited. If any points remain that can be resolved by telephone, the 
Examiner is invited to contact the undersigned at the below-given telephone number. 



CONCLUSION 



Respectfully submitted, 



KNOBBE, MARTENS, OLSON & BEAR, LLP 



Dated: 





Nancv.W. wiskef 
Registration No. 36,298 
Attorney of Record 
Customer No. 45,3 1 1 
(805) 547-5580 



AMEND 



2538523 
042006 
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<> NCB 



Blast 2 Sequences results 



PubMed 



Entrez 



BLAST 



OMIM 



Taxonomy 



Structure 



BLAST 2 SEQUENCES RESULTS VERSION BLASTN 2.2.13 [Nov-27-2005] 

gap open: 5 I gap extension: |2 | 



Match:! 1 1 Mismatch: 



x_dropoff: 50 expect: 10. 000 C wordsize: 11 Filter H View option i Standard 



Masking character option ! X for pro tein, n for nucleotide yy Masking color option Black [ 
H Show CDS translation I Align 



Sequence 1: lcl|seq_l 
Length = 9399(1 ..9399) 

Sequenced: lcl|seq__2 
Length = 9143 (1 ..9143) 




NOTE:Bitscore and expect value are calculated based on the size of the nr database. 

NOTE:If protein translation is reversed, please repeat the search with reverse strand of the query 
sequence. 



Score = 1.732e+04 bits (9009), Expect =0.0 
Identities = 9096/9137 (99%), Gaps =4/9137 (0%) 
Strand=Plus/Plus 

Query 1 ACCACAAACACTCCAGTTTGTTACACTCCGCTAGGAATGCTCCTGGAGCACCCCCCCTAG 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j ct 1 ACCACAAACACTCCAGTTTGTTACACTCCGCTAGGAATGCTCCTGGAGCACCCCCCCTAG 60 

Query 61 CAGGGCGTGGGGGATTTCCCCTGCCCGTCTGCAGAAGGGTGGAGCCAACCACCTTAGTAT 120 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Sbjct 61 CAGGGCGTGGGGGATTTCCCCTGCCCGTCTGCAGAAGGGTGGAGCCAACCACCTTAGTAT 120 

Query 121 GTAGGCGGCGGGACTCATGACGCTCGCGTGATGACAAGCGCCAAGCTTGACTTGGATGGC 180 
I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I 



http://www.ncbi.Illm.nih.gov^last^l2seq/wblast2.cgi?0 



4/20/2006 



Blast Result 



Page 2 of 12 



Sbjct 121 . GTAGGCGGCGGGACTCATGACGCTCGCGTGATGACAAGCGCCAAGCTTGACTTGGATGGC 180 

Query 181 CCTGATGGGCGTTCATGGGTTCGGTGGTGGTGGCGCTTTAGGCAGCCTCCACGCCCACCA 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Sb j Ct 181 CCTGATGGGCGTTCATGGGTTCGGTGGTGGTGGCGCTTTAGGCAGCCTCCACGCCCACCA 24 0 

Query 241 CCTCCCAGATAGAGCGGCGGCACTGTAGGGAAGACCGGGGACCGGTCACTACCAAGGACG 300 

I I I I I I I II I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sb j ct 241 CCTCCCAGATAGAGCGGCGGCACTGTAGGGAAGACCGGGGACCGGTCACTACCAAGGACG 300 

Query 301 CAGACCTCTTTTTGAGTATCACGCCTCCGGAAGTAGTTGGGCAAGCCCACCTATATGTGT 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Sbjct 301 CAGACCTCTTTTTGAGTATCACGCCTCCGGAAGTAGTTGGGCAAGCCCACCTATATGTGT 360 

Query 361 TGGGATGGTTGGGGTTAGCCATCCATACCGTACTGCCTGATAGGGTCCTTGCGAGGGGAT 4 20 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I 

Sb j ct 361 TGGGATGGTTGGGGTTAGCCATCCATACCGTACTGCCTGATAGGGTCCTTGCGAGGGGAT 420 

Query 421 CTGGGAGTCTCGTAGACCGTAGCACATGCCTGTTATTTCTACTCAAACAAGTCCTGTACC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sb j ct 421 CTGGGAGTCTCGTAGACCGTAGCACATGCCTGTTATTTCTACTCAAACAAGTCCTGTACC 480 

Query 481 TGCGCCCAGAACGCGCAAGAACAAGCAGACGCAGGCTTCATATCCTGTGTCCATTAAAAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1.1 I I 

Sb j ct 481 T G CG CC C AG AAC G CGC AAG AAC AAG C AG ACGC AG G C T T CAT AT CCTGTGTC CAT T AAAAC 54 0 

Query 54 1 ATCTGTTGAAAGGGGACAACGAGCAAAGCGCAAAGTCCAGCGCGATGCTCGGCCTCGTAA 600 

I I I I I I I I I 1. 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 541 ATCTGTTGAAAGGGGACAACGAGCAAAGCGCAAAGTCCAGCGCGATGCTCGGCCTCGTAA 600 

Query 601 TTACAAAATTGCTGGTATCCATGATGGCTTGCAGACATTGGCTCAGGCTGCTTTGCCAGC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 601 TTACAAAATTGCTGGTATCCATGATGGCTTGCAGACATTGGCTCAGGCTGCTTTGCCAGC 660 

Query 661 TCATGGTTGGGGACGCCAAGACCCTCGCCATAAGTCTCGCAATCTTGGAATCCTTCTGGA 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 661 TCATGGTTGGGGACGCCAAGACCCTCGCCATAAGTCTCGCAATCTTGGAATCCTTCTGGA 720 

Query 721 TTACCCTTTGGGGTGGATTGGTGATGTTACAACTCACACACCTCTAGTAGGCCCGCTGGT 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbj ct 721 TTACCCTTTGGGGTGGATTGGTGATGTTACAACTCACACACCTCTAGTAGGCCCGCTGGT 780 

Query 781 GGCAGGAGCGGTCGTTCGACCAGTCTGCCAGATAGTACGCTTGCTGGAGGATGGAGTCAA 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbj ct 781 GGCAGGAGCGGTCGTTCGACCAGTCTGCCAGATAGTACGCTTGCTGGAGGATGGAGTCTVA 840 

Query 841 CTGGGCTACTGGTTGGTTCGGTGTCCACCTTTTTGTGGTATGTCTGCTATCTTTGGCCTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 841 CTGGGCTACTGGTTGGTTCGGTGTCCACCTTTTTGTGGTATGTCTGCTATCTTTGGCCTG 900 

Query 901 TCCCTGTAGTGGGGCGCGGGTCACTGACCCAGACACAAATACCACAATCCTGACCAATTG 960 

I I II I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I II 

Sbj ct 901 TCCCTGTAGTGGGGCGCGGGTCACTGACCCAGACACAAATACCACAATCCTGACCAATTG 960 

Query 961 CTGCCAGCGTAATCAGGTTATCTATTGTTCTCCTTCCACTTGCCTACACGAGCCTGGTTG 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbj ct 961 CTGCCAGCGTAATCAGGTTATCTATTGTTCTCCTTCCACTTGCCTACACGAG.CCTGGTTG 1020 

Query 1021 TGTGATCTGTGCGGACGAGTGCTGGGTTCCCGCCAATCCGTACATCTCACACCCTTCCAA 1080 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I Ml I I I I I ! I I I I I I I I I I 
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JUL 


1021 


Query 


1081 


O i~J J L L. 


1081 


yuci y 


1141 


OJJJ l-U 


1141 


Query 


1201 


CKn rt 


1201 


Query 


12 61 


^bi rt* 


1261 


Diiptv 


1321 


OJJ J U 


X -J <~ X- 


yuciy 


1381 


Sb j ct 


1381 


Query 


1441 


^bi rt* 


14 41 

X *4 M J. 


yuci y 




CK-i 
OJJ J u u 


i sni 

J. U \J X 


Query 


1561 


JUL 


1 

1 JLtl 


Query 


1621 


Sb j ct 


1621 


Query 


1681 


Sb j ct 


1681 


Ol 1PTU 

Sc uc x. y 


1741 


Sb j ct 


1741 


Qusiry 


1801 


Sb j ct 


1801 


Query 


1861 


Sbjct 


1861 


Query 


1921 



TGTGATCTGCGCGGACGAGTGCTGGGTTCCCGCCAATCCGTACATCTCACACCCTTCCAA 1080 

TTGGACTGGCACGGACTCCTTCTTGGCTGACCACATTGATTTTGTTATGGGCGCTCTTGT 114 0 
I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTGGACTGGCACGGACTCCTTCTTGGCTGACCACATTGAfTTTGTTATGGGCGCTCTTGT 114 0 

GACCTGTGACGCCCTTGACATTGGTGAGTTGTGTGGTGCGTGTGTATTAGTCGGTGACTG 1200 
I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GACCTGTGACGCCCTTGACATTGGTGAGTTGTGTGGTGCGTGTGTATTAGTCGGTGACTG 1200 

GCTTGTCAGGCACTGGCTTATTCACATAGACCTCAATGAAACTGGTACTTGTTACCTGGA 1260 
I I I I I I I I I I I I I I I II I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCTTGTCAGGCACTGGCTTATTCACATAGACCTCAATGAAACTGGTACTTGTTACCTGGA 12 60 

AGTGGCCACTGGAATAGATCCTGGGTTCCTAGGGTTTATCGGGTGGATGGCCGGCAAGGT 1320 
I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGTGCCCACTGGAATAGATCCTGGGTTCCTAGGGTTTATCGGGTGGATGGCCGGCAAGGT 1320 

CGAGGCTGTCATCTTCTTGACCAAACTGGCTTCAC7VAGTACCATACGCTATTGCGACTAT 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I . 

CGAGGCTGTCATCTTCTTGACCAAACTGGCTTCACAAGTACCATACGCTATTGCGACTAT 1380 

GTTTAGCAGTGTACACTACCTGGCGGTTGGCGCTCTGATCTACTATGCCTCTCGGGGCAA 14 4 0 
I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GTTTAGCAGTGTACACTACCTGGCGGTTGGCGCTCTGATCTACTATGCCTCTCGGGGCAA 14 4 0 

GTGGTATCAGTTGCTCCTAGCGCTTATGCTTTACATAGAAGCGACCTCTGGAAACCCCAT 1500 - 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

GTGGTATCAGTTGCTCCTAGCGCTTATGCTTTACATAGAAGCGACCTCTGGAAACCCTAT 1500 

CAGGGTGCCCACTGGATGCTCAATAGCTGAGTTTTGCTCGCCTTTGATGATACCATGTCC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAGGGTGCCCACTGGATGCTCAATAGCTGAGTTTTGCTCGCCTTTGATGATACCATGTCC 1560 

TTGCCACTCTTATTTGAGTGAGAATGTGTCAGAAGTCATTTGTTACAGTCCAAAGTGGAC 1620 
I I j I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I- 1 I I I I I I I I I I I I I I I I I I I 

TTGCCACTCTTATTTGAGTGAGAATGTGTCAGAAGTCATTTGTTACAGTCCAAAGTGGAC 1620 

C AG G CC T AT C AC T C T AG AG T AT AAC AAC T C CAT AT C T T GGT AC C C C T AT AC AAT C C C T G G ' 1680 

I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

CAGGCCTGTCACTCTAGAGTATAACAACTCCATATCTTGGTACCCCTATACAATCCCTGG 1680 

TGCGAGGGGATGTATGGTTAAATTCAAAAATAACACATGGGGTTGCTGCCGTATTCGCAA 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

TGCGAGGGGATGTATGGTTAAATT'CAAAAATAACACATGGGGTTGCTGCCGTATTCGCAA 17 4 0 

TGTGCCATCGTACTGCACTATGGGCACTGATGCAGTGTGGAACGACACTCGCAACACTTA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

TGTGCCATCGTACTGCACTATGGGCACTGATGCAGTGTGGAACGACACTCGCAACACTTA 1800 

CGAAGCATGCGGTGTAACACCATGGCTAACAACCGCATGGCACAACGGCTCAGCCCTGAA 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CGAAGCATGCGGTGTAACACCATGGCTAACAACCGCATGGCACAACGGCTCAGCCCTGAA 18 60 

ATTGGCTATATTACAATACCCTGGGTCTAAAGAAATGTTTAAACCTCATAATTGGATGTC 1920 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATTGGCTATATTACAATACCCTGGGTCTAAAGAAATGTTTAAACCTCATAATTGGATGTC 1920 

AGGCCATTTGTATTTTGAGGGATCAGATACCCCTATAGTTTACTTTTATGACCCTGTGAA 1980 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Sbjct 1921 AGGCCATTTGTATTTTGAGGGATCAGATACCCCTATAGTTTACTTTTATGACCCTGTGAA 1980 





1 Q91 

± .3 ^ ± 
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2761 


Sbjct 


2761 


Query 


2821 



TTCCACTCTCCTACCACCGGAGAGGTGGGCTAGGTTGCCCGGTACCCCACCTGTGGTACG 

I | | | | | | | | | I I I I I I I I I I I I I I I t I I t I I I I I I I I I I I M I I I I I I I I I I I I I I M M 
TTCCACTCTCCTACCACCGGAGAGGTGGGCTAGGTTGCCCGGTACCCCACCTGTGGTACG 

TGGTTCTTGGTTACAGGTTCCGCAAGGGTTTTACAGTGATGTGAAAGACCTAGCCACAGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II 
TGGTTCTTGGTTACAGGTTCCGCAAGGGTTTTACAGTGATGTGAAAGACCTAGCCACAGG 

ATTGATCACCAAAGACAAAGCCTGGAAAAATTATCAGGTCTTATATTCCGCCACGGGTGC 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I u I 
AT T GAT C AC C AAAG AC AAAG C C T G G AAAAAT TAT C AG G T C T TAT AT T C C GCC AC G G G T GC 

TTTGTCTCTTACGGGAGTTACCACCAAGGCCGTGGTGCTAATTCTGTTGGGGTTGTGTGG 

I | | | | I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTTGTCTCTTACGGGAGTTACCACCAAGGCCGTGGTGCTAATTCTGTTGGGGTTGTGTGG 

CAGCAAGTATCTTATTTTAGCCTACCTCTGTTACTTGTCCCTTTGTTTTGGGCGCGCTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGCAAGTATCTTATTTTAGCCTACCTCTGTTACTTGTCCCTTTGTTTTGGGCGCGCTTC 

TGGTTACCCTTTGCGTCCTGTGCTCCCATCCCAGTCGTATCTCCAAGCTGGCTGGGATGT 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
TGGTTACCCTTTGCGTCCTGTGCTCCCATCCCAGTCGTATCTCCAAGCTGGCTGGGATGT 



2040 



2040 



2100 



2100 



2160 



2160 



2220 



2220 



2280 



2280 



2340 



2340 



2400 



TTTGTCTAAAGCTCAAGTAGCTCCTTTTGCTTTGATTTTCTTCATCTGTTGCTATCTCCG 

I | || I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ' 1 I I I I 
TTTGTCTAAAGCTCAAGTAGCTCCTTTTGCTTTGATTTTCTTCATCTGTTGC ^ "CG 2400 



CTGCAGGCTACGTTATGCTGCCCTTTTAGGGTTTGTGCCCATGGCTGCGGb 

I I I I I I I II I I I I I I I I IJ I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTGCAGGCTACGTTATGCTGCCCTTTTAGGGTTTGTGCCCATGGCTGCGGSCTTGu 



AACTTTCTTTGTTGCAGCAGCTGCTGCCCAACCAGATTATGACTGGT^G 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I lj 
AACTTTCTTTGTTGCAGCAGCTGCTGCCCAACCAGATTATGACTGGT 




CGACTGCT 

I I I I I I I I 

GCGACTGCT 



AGTGGCAGGGTTAGTTTTGTGGGCCGGCCGTAACCGTGGTCACCGCATAGCTCTGCTTGT 

I I I I I I I I II II I I I I II I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
AGTGGCAGGGTTAGTTTTGTGGGCCGGCCGTGACCGTGGTCCACGTATAGCTCTGCTTGT 

AGGTCCTTGGCCTCTGGTAGCGCTTTTAACCCTCTTGCATTTGGTTACGCCTGCTTCAGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGGTCCTTGGCCTCTGGTAGCGCTTTTAACCCTCTTGCATTTGGCTACGCCTGCTTCAGC 

TTTTGATACCGAGATAATTGGAGGGCTGACAATACCACCTGTAGTAGCATTAGTTGTCAT 
I I I I M | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
T T T T G AC ACC G AG AT AAT T G G AGGG C T G AC AAT AC C AC C T G TAG TAG CAT TAG T T G T CAT 

GTCTCGTTTTGGCTTCTTTGCTCACTTGTTACCTCGCTGTGCTTTAGTTAACTCCTATCT 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTCTCGTTTTGGCTTCTTTGCTCACTTGTTACCTCGCTGTGCTTTAGTTAACTCCTATCT 

TTGGCAACGTTGGGAGAATTGGTTTTGGAACGTTACACTAAGACCGGAGAGGTTTTTCCT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTGGCAACGTTGGGAGAATTGGTTTTGGAACGTTACACTAAGACCGGAGAGGTTTCTCCT 

TGTGCTGGTTTGTTTCCCCGGTGCGACATATGACGCGCTGGTGACTTTCTGTGTGTGTCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Sbjct 2821 TGTGCTGGTTTGTTTCCCCGGTGCGACATATGACACGCTGGTGACTTTCTGTGTGTGTCA 2880 
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Sbjct 2881 

Query 2 941 
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Query 3001 
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Query 3061 

Sbjct 3061. 
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CGTAGCTCTTCTATGTTTAACATCCAGTGCAGCATCGTTCTTTGGGACTGACTCTAGGGT 2 94 0 

i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i hi i i i i i i i i i i i i i i i i i i i i i i i i i i 

.CGTAGCTCTTCTATGTTTAACATCCAGTGCAGCATCGTTCTTTGGGACTGACTCTAGGGT 294 0 

TAGGGCCCATAGAATGTTGGTGCGTCTCGGAAAGTGTCATGCTTGGTATTCTCATTATGT 3000 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TAGGGCCCATAGAATGTTGGTGCGTCTCGGAAAGTGTCATGCTTGGTATTCTCATTATGT 3000 

TCTTAAGTTTTTCCTCTTAGTGTTTGGTGAG7VATGGTGTGTTTTTCTATAAGCACTTGCA 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCTTAAGTTTTTCCTCTTAGTGTTTGGTGAGAATGGTGTGTTTTTCTATAAGCACTTGCA 3060 

TGGTGATGTCTTGCCTAATGATTTTGCCTCGAAACTACCATTGCAAGAGCCATTTTTCCC 3120 
I I I I I I I I I I I I I I I I I I I I I I I I 1.1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGGTGATGTCTTGCCTAATGATTTTGCCTCGAAACTACCATTGCAAGAGCCATTTTTCCC 3120 

TTTTGAAGGCAAGGCAAGGGTCTATAGGAATGAAGGAAGACGCTTGGCGTGTGGGGACAC '3180 
I II I I I II I I I I I I I I I |.| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTTTGAAGGCAAGGCAAGGGTCTATAGGAATGAAGGAAGACGCTTGGCGTGTGGGGACAC 3180 

GGTTGATGGTTTGCCCGTTGTTGCGCGTCTCGGCGACCTTGTTTTCGCAGGGTTGGCTAT 324 0 
I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGTTGATGGTTTGCCCGTTGTTGCGCGTCTCGGCGACCTTGTTTTCGCAGGGTTAGCTAT 324 0 

GCCGCCAGATGGGTGGGCCATTACCGCACCTTTTACGCTGCAGTGTCTCTCTGAACGTGG 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCGCCAGATGGGTGGGCCATTACCGCACCTTTTACGCTGCAGTGTCTCTCTGAACGTGG 3300 

CACGCTGTCAGCGATGGCAGTGGTCATGACTGGTATAGACCCCCGAACTTGGACTGGAAC 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CACGCTGTCAGCGATGGCAGTGGTCATGACTGGTATAGACCCCCGAACTTGGACTGGAAC 3360 

TATCTTCAGATTAGGATCTCTGGCCACTAGCTACATGGGATTTGTTTGTGACAACGTGTT 3420 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I 
TATCTTCAGATTAGGATCTCTGGCCACTAGCTACATGGGATTTGTTTGTGACAACGTGTT 3420 

GTATACTGCTCACCATGGCAGCAAG'GGGCGCCGGTTGGCTCATCCCACAGGCTCTATACA 3480 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I 
GTATACTGCTCACCATGGCAGCAAGGGGC'GCCGGTTGGCTCATCCCACAGGCTCCATACA 3480 

CCCAATAACCGTTGACGCGGCTAATGACCAGGACATCTATCAACCACCATGTGGAGCTGG 3540 
I II I I I I I II I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I 
CCCAATAACCGTTGACGCGGCTAATGACCAGGACATCTATCAACCACCATGTGGAGCTGG 3540 

GTCCCTTACTCGGTGCTCTTGCGGGGAGACCAAGGGGTATCTGGTAACACGACTGGGGTC 3600 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTCCCTTACTCGGTGCTCTTGCGGGGAGACCAAGGGGTATCTGGTAACACGACTGGGGTC 3600 

ATTGGTTGAGGTCAACAAATCCGATGACCCTTATTGGTGTGTGTGCGGGGCCCTTCCCAT 3660 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II l-l I I I I I I I I I I I I I I I I I 
ATTGGTTGAGGTCAACAAATCCGATGACCCTTATTGGTGTGTGTGCGGGGCCCTTCCCAT 3660 

GGCTGTTGCCAAGGGTTCTTCAGGTGCCCCGATTCTGTGCTCCTCCGGGCATGTTATTGG 3720 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I 
GGCTGTTGCCAAGGGTTCTTCAGGTGCCCCGATTCTGTGCTCCTCCGGGCATGTTATTGG 3720 

GATGTTCACCGCTGCTAGAAATTCTGGCGGTTCAGTCAGTCAGATTAGGGTTAGGCCGTT 3780 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Sbjct 3721 GATGTTCACCGCTGCTAGAAATTCTGGCGGTTCAGTCAGCCAGATTAGGGTTAGGCCGTT 3780 

GGTGTGTGC T GG AT AC C AT CC C C AG T AC AC AGC AC AT G CCAC T C T T G AT AC AAAAC C T AC 3840 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

GGTGTGTGCTGGATACCATCCCCAGTACACAGCACATGCCACTCTTGATACAAAACCTAC 3840 

TGTGCCTAACGAGTATTCAGTGCAAATTTTAATTGCCCCCACTGGCAGCGGCAAGTCAAC 3900 

I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

TGTGCCTAACGAGTATTCAGTGCAAATTTTAATTGCCCCCACTGGCAGCGGCAAGTCAAC 3900 

C AAAT T AC C AC T T T C T T AC AT GC AG G AG AAG TAT G AGG T CTTGGTCC T AAAT C C C AG T G T 3960 

I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I M I i I I I I I I I I I I I I 

CAAATTACCACTTTCTTACATGCAGGAGAAGTATGAGGTCTTGGTCCTAAATCCCAGTGT 3960 

GGCTACAACAGCATCAATGCCAAAGTACATGCACGCGACGTACGGCGTGAATCCAAATTG 4 020 
I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGCTACAACAGCATCAATGCCAAAGTACATGCACGCGACGTACGGCGTGAATCCAAATTG 4 020 

CTATTTTAATGGCAAATGTACCAACACAGGGGCTTCACTTACGTACAGCACATATGGCAT 4 080 

I I I I I I I I I I I I I I I I I I II I I I I! I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

CTATTTTAATGGCAAATGTACCAACACAGGGGCTTCACTTACGTACAGCACATATGGCAT 4 080 

GTACCTGACCGGAGCATGTTCCCGGAACTATGATGTAATCATTTGTGACGAATGCCATGC 414 0 

I I I I I I I I I I I I I I I I I II I I M.I I I I I I I I I I. M I II I I I I I I I I II I I I I I I I I I I 

GTACCTGACCGGAGCATGTTCCCGGAACTATGACGTCATCATTTGTGACGAATGCCATGC 4140 

TACCGATGCAACCACCGTGTTGGGCATTGGAAAGGTCCTAACCGAAGCTCCATCCAAAAA 4 200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TACCGATGCAACCACCGTGTTGGGCATTGGAAAGGTTCTAACCGAAGCTCCATCCAAAAA 4 200 

TGTTAGGCTAGTGGTTCTTGCCACGGCTACCCCCCCTGGAGTAATCCCTACACCACATGC 4 260 

I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGTTAGGCTAGTGGTTCTTGCCACGGCTACCCCCCCTGGAGTAATCCCTACACCACATGC 4 260 

CAACATAACTGAGATTCAATTAACCGATGAAGGCACTATCCCCTTTCATGGAAAAAAGAT 4 320 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

C AAC AT AAC T GAG AT T C AAT T AACCG AT G AAGG C AC TAT C C CCT T T CAT G G AAAAAAG AT 4320 

T AAG GAG G AAAAT C T G AAG AAAG G GAG AC AC C T TAT C T T T G AGG C T AC C AAAAAAC AC T G 4 380 
I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

TAAGGAGGAAAATCTGAAGAAAGGGAGACACCTTATCTTTGAGGCTACCAAAAAACACTG 4 380 

TGATGAGCTTGCTAACGAGTTAGCTCGAAAGGGAATAACAGCTGTCTCTTACTATAGGGG 4 44 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

TGATGAGCTTGCTAACGAGTTAGCTCGAAAGGGAATAACAGCTGTCTCTTACTATAGGGG 4 440 

ATGTGACATCTCAAAAATCCCTGAGGGCGACTGTGTAGTAGTTGCCACTGATGCCTTGTG 4500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATGTGACATCTCAAAAATCCCTGAGGGCGACTGTGTAGTAGTTGCCACTGATGCCTTGTG 4 500 

TACAGGGTACACTGGTGACTTTGATTCCGTGTATGACTGCAGCCTCATGGTAGAAGGCAC 4 560 

I | | | | | | I | I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M I I I I I I I I I I I I I I I I I I I 

TACAGGGTACACTGGTGACTTTGATTCCGTGTATGACTGCAGCCTCATGGTAGAAGGCAC 4 560 

ATGCCATGTTGACCTTGACCCTACTTTCACCATGGGTGTTCGTGTGTGCGGGGTTTCAGC 4 620 

I | I I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I Mill 

ATGCCATGTTGACCTTGACCCTACTTTCACCATGGGTGTTCGTGTGTGCGGGGTCTCAGC 4 620 

AATAGTTAAAGGCCAGCGTAGGGGCCGCACAGGCCGTGGGAGAGCTGGCATATACTACTA 4 680 
I I I I I I I II I II I II I I I I I I II I II I I II II I I I II I M I I I II I I II I I II I II I I I I 
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Sbj ct 4 621 AATAGTTAAAGGCCAGCGTAGGGGCCGCACAGGCCGTGGGAGAGCTGGCATATACTACTA 4 680 

TGTAGACGGGAGTTGTACCCCTTCGGGTATGGTTCCTGAATGCAACATTGTTGAAGCCTT 474 0 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 it 1 1 1 

TGTAGACGGGAGTTGTACCCCTTCGGGTATGGTTCCTGAATGCAACATTGTTGAAGCCTT 4740 

CGACGCAGCCAAGGCATGGTATGGTTTGTCATCAACAGAAGCTCAAACTATTCTGGACAC 4 800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CGACGCAGCCAAGGCATGGTATGGTTTGTCATCAACAGAAGCTCAAACTATTCTGGACAC 4 800 

CTATCGCACCCAACCTGGGTTACCTGCGATAGGAGCAAATTTGGACGAGTGGGCTGATCT 4 860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

CTATCGCACCCAACGTGGGTTACCTGCGATAGGAGCAAATTTGGACGAGTGGGCTGATCT 4860 

CTTTTCTATGGTCAACCCCGAACCTTCATTTGTCAATACTGCAAAAAGAACTGCTGACAA 4 920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTTTTCTATGGTCAACCCCGAACCTTCATTTGTCAATACTGCAAAAAGAACTGCTGACAA 4 920 

TTATGTTTTGTTGACTGCAGCCCAACTACAACTGTGTCATCAGTATGGCTATGCTGCTCC 4 980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTATGTTTTGTTGACTGCAGCCCAACTACAACTGTGTCATCAGTATGGCTATGCTGCTCC 4 980 

CAATGACGCACCACGGTGGCAGGGAGCCCGGCTTGGGAAAAAACCTTGTGGGGTTCTGTG 5040 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAATGACGCACCACGGTGGCAGGGAGCCCGGCTTGGGAAAAAACCTTGTGGGGTTCTGTG 5040 

GCGCTTGGACGGCGCTGACGCCTGTCCTGGCCCAGAGCCCAGCGAGGTGACCAGATACCA 5100 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCGCTTGGACGGCGCTGACGCCTGTCCTGGCCCAGAGCCCAGCGAGGTGACCAGATACCA 5100 

AATGTGCTTCACTGAAGTCAATACTTCTGGGACAGCCGCACTCGCTGTTGGCGTTGGAGT 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AATGTGCTTCAGTGAAGTCAATACTTCTGGGACAGCCGCACTCGCTGTTGGCGTTGGAGT 5160 

GGCTATGGCTTATCTAGCCATTGACACTTTTGGCGCCACTTGTGTGCGGCGTTGCTGGTC 5220 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGCTATGGCTTATCTAGCCATTGACACTTTTGGCGCCACTTGTGTGCGGCGTTGCTGGTC 5220 

TATTACATCAGTCCCTACCGGTGCTACTGTCGCCCCAGTGGTTGACGAAGAAGAAATCGT 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TATTACATCAGTCCCTACCGGTGCTACTGTCGCCCCAGTGGTTGACGAAGAAGAAATCGT 5280 

GGAGGAGTGTGCATCATTCATTCCCTTGGAGGCCATGGTTGCTGCAATTGACAAGCTGAA 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

GGAGGAGTGTGCATCATTCATTCCCTTGGAGGCCATGGTTGCTGCAATCGATAAGCTGAA 5340 

G AG T AC AAT C AC C AC AAC T AGT C C T T T C AC AT T GG AAAC C GCC C T T G AAAAAC T T AAC AC 5400 
I | | | | | | II I | I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

G AGT AC AAT AACC AC AAC T AGTCC TT TC AC AT TGGAAACC GCC CT T GAAAAAC T T AAC AC 5400 

CTTTCTTGGGCCTCATGCAGCTACAATCCTTGCTATCATAGAGTATTGCTGTGGTTTAGT 54 60 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

CTTTCTTGGGCCTCATGCAGCTACAATCCTTGCTATCATAGAGTATTGCTGTGGCTTAGT 54 60 

CACTTTACCTGACAATCCCTTTGCATCATGCGTGTTTGCTTTCATTGCGGGTATTACTAC 5520 

I I [ I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CACTTTACCTGACAATCCCTTTGCATCATGCGTGTTTGCTTTCATTGCGGGTATTACTAC 5520 

CCCACTACCTCACAAGATCAAAATGTTCCTGTCATTATTTGGAGGCGCAATTGCGTCCAA 5580 

I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I MINIMUM 



Sbj ct 


4621 




4681 


Shi ct 


4681 


Query 


4741 


Sbjct 


4741 


Onerv 


4801 


Shi ct 


4801 




48 61 


cK-i ct 


4 8 61 
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4921 


Sbj ct 


4921 


Query 


4981 


Shi ct 


4981 


Query 


>J U *s J- 


qh-i ct 


S04 1 

+J \J 1 X 
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5101 


Sbj ct 


5101 


Query 


5161 


CK-i ct 


5161 




5221 


Sbj ct 


5221 


Query 


5281 


Sbj ct 


5281 


W u ci y 


S341 


Shi ct 


5341 


Query 


5401 


Shi ct 


5401 


Query 


5461 


Sbjct 


5461 


Query 


5521 
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ou J v_ L 


J .J Z, X 


Query 


t; Sft 1 

J JOl 


oD J Ct 


5 Sftl 


Query 


5641 


OK-i n f 
OJ-> J L- 


5641 




5701 


ODJ CI 


01 


Query 


R7 61 


oD] CI 


R7 61 






oU J Cl 


^ft 91 


Quer y 


Rft ft 1 


oD] C L 


Rft ft 1 
JOOl 


Query 


D ? H X 


oD] CT. 


R Q4 1 

O :7 ft X 


i o r* \/ 
ylicl _y 


U U U X 




com 


Query 


60 61 


OD] CC 


0 U OX 


Quer y 


61 91 


OiJ J t_ L 


61 91 




6181 


Chi rt- 


61 R1 


yuci y 


6941 

O <£. fl X 


OD] CL 


69 4 1 


C}l 1DTV 

vu-cx y 


6^01 


CK-; 
OJJ J O C 


6*301 


Query 


6361 


Sbjct 


6361 


Query 


6421 



CCCACTACCTCACAAGATCAAAATGTTCCTGTCATTATTTGGAGGCGCAATTGCGTCCAA 5580 

GCTTACAGACGCTAGAGGCGCACTGGCGTTCATGATGGCCGGGGCTGCGGGAACAGCTCT 5640 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCTTACAGACGCTAGAGGCGCACTGGCGTTCATGATGGCCGGGGCTGCGGGAACAGCTCT 564 0 

TGGTACATGGACATCGGTGGGTTTTGTCTTTGACATGCTAGGCGGCTATGCTGCCGCCTC 5700 

I I I I I I I I I I I I I I I I I I I I I I 1. 1 I It I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGGTACATGGACATCGGTGGGTTTTGTCTTTGACATGCTAGGCGGCTATGCTGCCGCCTC 5700 

ATCCACTGCTTGCTTGACATTTAAATGCTTGATGGGTGAGTGGCCCACTATGGATCAGCT 57 60 

I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

ATCCACTGCTTGCTTGACATTTAAATGCTTGATGGGTGAGTGGCCCACTATGGATCAGCT 57 60 

TGCTGGTTTAGTCTACTCCGCGTTCAATCCGGCCGCAGGAGTTGTGGGCGTCTTGTCAGC 5820 

I I I I I I I I I I I I I I I I I I I I I I U I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGCTGGTTTAGTCTACTCCGCGTTCAATCCGGCCGCAGGAGTTGTGGGCGTCTTGTCAGC 5820 

TTGTGCAATGTTTGCTTTGACAACAGCAGGGCCAGATCACTGGCCCAACAGACTTCTTAC 5880 
I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I II 1 1 I I I I I I I I I I I I 

TTGTGCAATGTTTGCTTTGACAACAGCAGGGCCAGATCACTGGCCCT^ACAGACTTCTTAC 5880 

TATGCTTGCTAGGAGCAACACTGTATGTAATGAGTACTTTATTGCCACTCGTGACATCCG 5940 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TATGCTTGCTAGGAGCAACACTGTATGTAATGAGTACTTTATTGCCACTCGTGACATCCG 594 0 

CAGGAAGATACTGGGCATTCTGGAGGCATCTACCCCCTGGAGTGTCATATCAGCTTGCAT 6000 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAGGAAGATACTGGGCATTCTGGAGGCATCTACCCCCTGGAGTGTCATATCAGCTTGCAT 6000 

CCGTTGGCTCCACACCCCGACGGAGGATGATTGCGGCCTCATTGCTTGGGGTCTAGAGAT 6060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II 

CCGTTGGCTCCACACCCCGACGGAGGATGATTGCGGCCTCATTGCTTGGGGTCTAGAGAT 6060 

TTGGCAGTATGTGTGCAATTTCTTTGTGATTTGCTTTAATGTCCTTAAAGCTGGAGTTCA 6120 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTGGCAGTATGTGTGCAATTTCTTTGTGATTTGCTTTAATGTCCTTAAAGCTGGAGTTCA 6120 

GAGCATGGTTAACATTCCTGGTTGTCCTTTCTACAGCTGCCAGAAGGGGTACAAGGGCCC 6180 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAGCATGGTTAACATTCCTGGTTGTCCTTTCTACAGCTGCCAGAAGGGGTACAAGGGCCC 6180 

CTGGATTGGATCAGGTATGCTCCAAGCACGCTGTCCATGCGGTGCTGAACTCATCTTTTC 6240 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGGATTGGATCAGGTATGCTCCAAGCACGCTGTCCATGCGGTGCTGAACTCATCTTTTC 624 0 

TGTTGAGAATGGTTTTGCAAAACTTTACAAAGGACCCAGAACTTGTTCAAATTACTGGAG 6300 

II I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I 
TGTTGAGAATGGTTTTGCAAAACTTTACAAAGGACCCAGAACTTGTTCAAATTACTGGAG 6300 

AGGGGCTGTTCCAGTCAACGCTAGGCTGTGTGGGTCGGCTAGACCGGACCCAACTGATTG 6360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGGGGCTGTTCCAGTCAACGCTAGGCTGTGTGGGTCGGCTAGACCGGACCCAACTGATTG 6360 

GACTAGTCTTGTCGTCAATTATGGCGTTAGGGACTACTGTAAATATGAGAAAATGGGAGA 6420 

I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GACTAGTCTTGTCGTCAATTATGGCGTTAGGGACTACTGTAAATATGAGAAATTGGGAGA 6420 

TCACATTTTTGTTACAGCAGTATCCTCTCCAAATGTCTGTTTCACCCAGGTGCCCCCAAC 64 80 
I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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qhi n+- 


6421 


^ uitJi y 


64 81 


qhi pf 

DJJ J 1_ 


64 81 




6541 


OJJJ <~ u 


6541 


Query 


6601 




6601 


Query 


6661 


OK-i n f 
DU J L- L 


6661 

\J \J \> X 


C)\ ipr\7 

v^ut; i. y 


6721 


CK-i r 4- 
OXJ J U L. 


6791 


vuery 


67R1 

V / O X 


oD] CL 


67 P 1 

D / O X 


\s x. y 


6R41 

Dull 


OJJJ U L 


6fi 4 1 




6901 

U Zf \J X 


oJJ J C L 


6Q01 


Query 


6Q61 
O -? ox 




6Q61 
D j D x 


vutrx y 


7091 


OKn of 

OJJ J U 


7021 


Sti J- y 


7081 


OJJJ \^ L. 


70R1 


yuci y 


7141 


CK-1 ^4- 
OUJ CL 


7141 

/ X H X 


Lit; j. y 


7201 


OJJJ v^, L. 


7201 


Query 


7261 


Sbjct 


7261 


Query 


7321 



TCACATTTTTGTTACAGCAGTATCCTCTCCAAATGTCTGTTTCACCCAGGTGCCCCCAAC 6480 

CTTGAGAGCTGCAGTGGCCGTGGACGGCGTACAGGTTCAGTGTTATCTAGGTGAGCCCAA 6540 

I I || | I I I II I I I I I I II II I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I 

CTTGAGAGCTGCAGTGGCCGTGGACGGCGTACAGGTTCAGTGTTATCTAGGTGAGCCCAA 6540 

7\ACTCCTTGGACGACATCTGCTTGCTGTTACGGTCCTGACGGTAAGGGTAAAACTGTTAA 6600 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AACTCCTTGGACGACATCTGCTTGCTGTTACGGTCCGGACGGTAAGGGTAAAACTGTTAA 6600 

GCTTCCCTTCCGCGTTGACGGTCACACACCTGGTGTGCGCATGCAACTTAATTTGCGTGA 6660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I M I I I I I I I I I I 

GCTTCCCTTCCGCGTTGACGGTCACACACCTGGTGTGCGCATGCAACTTAATTTGCGTGA 6660 

TGCACTTGAGACAAATGACTGTAATTCCACAAACAACACTCCTAGTGATGAAGCCGCAGT 6720 

I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I 

TGCACTTGAGACAAATGACTGTAATTCCATAAACAACACTCCTAGTGATGAAGCCGCAGT 6720 

GTCCGCTCTTGTTTTCAAACAGGAGTTGCGGCGTACAAACCAATTGCTTGAGGCAATTTC 6780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GTCCGCTCTTGTTTTCAAACAGGAGTTGCGGCGTACAAACCAATTGCTTGAGGCAATTTC 6780 

AGCTGGCGTTGACACCACCAAACTGCCAGCCCCCTCCATCGAAGAGGTAGTGGTAAGAAA 6840 
I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGCTGGCGTTGACACCACCAAACTGCCAGCCCCCTCCATCGAAGAGGTAGTGGTAAGAAA 6840 

GCGCCAGTTCCGGGCAAGAACTGGTTCGCTTACCTTGCCTCCCCCTCCGAGATCCGTCCC 6900 

I I I I I I I I I I II I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCGCCAGTTCCGGGCAAGAACTGGTTCGCTTACCTTGCCTCCCCCTCCGAGATCCGTCCC 6900 

AGGAGTGTCATGTGCTG/^AAGCCTGCAACGAAGTGACCCGTTAGAAGGTCCTTCAAACCT 6960 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 r 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AGGAGTGTCATGTCCTGAAAGCCTGCAACGAAGTGACCCGTTAGAAGGTCCTTCAT^ACCT 6960 

CCCTCCTTCACCACCTGTTCTACAGTTGGCCATGCCGATGCCCCTGTTGGGAGCGGGTGA 7020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M 

CCCTTCTTCACCACCTGTTCTACAGTTGGCCATGCCGATGCCCCTGTTGGGAGCAGGTGA 7020 

GTGTAACCCTTTCACTGCAATTGGATGTGCAATGACCGAAACAGGCGGAGGCCCTGATGA 7080 

I I I I I I I I I I I I II I II I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GTGTAACCCTTTCACTGCAATTGGATGTGCAATGACCGAAACAGGCGGAGGCCCTGATGA 7 080 

TTTACCCAGTTACCCTCCCAAAAAGGAGGTCTCTGAATGGTCAGACGAAAGTTGGTCGAC 7140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

TTTACCCAGTTACCCTCCCAAAAAGGAGGTCTCTGAATGGTCAGACGGAAGTTGGTCAAC 714 0 

GGCTACAACCGCTTCCAGCTACGTTACTGGCCCCCCGTACCCTAAGATACGGGGAAAGGA 7200 
I I I I I I II I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

GACTACAACCGCTTCCAGCTACGTTACTGGCCCCCCGTACCCTAAGATACGGGGAAAGGA 7200 

TTCCACTCAGTCAGCCCCCGCCAAACGGCCTACAAAAAAGAAGTTGGGAAAGAGTGAGTT 72 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

TTCCACTCAGTCAGCCCCCGCCAAACGGCCTACAAAAAAGAAGTTGGGAAAGAGTGAGTT 7260 

TTCGTGCAGCATGAGCTACACCTGGACCGACGTGATTAGCTTCAAAACTGCTTCTAAAGT 7320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTCGTGCAGCATGAGCTACACTTGGACCGACGTGATTAGCTTCAAAACTGCTTCTAAAGT 7320 

TCTGTCTGCAACTCGGGCCATCACTAGTGGTTTCCTCAAACAAAGATCATTGGTGTATGT 7380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
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7381 


Sbjct 


7381 


Ouerv 


7441 


Sbjct 


7441 


Query 


7501 


Sbjct 


7501 


Query 


7561 


Sbjct 


7561 


Query 


7621 


Sbjct 


7621 


Query 


7681 


Sbjct 


7681 


Query 


7741 


Sbjct 


7741 


Ouerv 


7801 


Sbjct 


7801 


Query 


7861 


Sbjct 


7861 


Query 


7921 


Sbjct 


7921 


Query 


7981 


Sbjct 


7981 


Query 


8041 


Sbjct 


8041 


Query 


8101 


Sbjct 


8101 


Query 


8161 


Sbjct 


8161 


Query 


8221 



TCTGTCTGCAACTCGGGCGATCACTAGTGGTTTCCTCAAACAAAGATCATTGGTGTATGT 738 0 

G AC T GAG C C G C G GG AT G C GG AGC T T AG AAAAC AAAAAG T C AC TAT T AAT AG AC AAC C T C T 744 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

GACTGAGCCGCGGGATGCGGAGCTTAGAAAACAAAAAGTCACTATTAATAGACAACCTCT 74 4 0 

GTTCCCCCCATCATACCACAAGCAAGTGAGATTGGCTAAGGAAAAAGCTTCAAAAGTTGT 7500 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GT T C C C C CC AT CAT AC C AC AAGC AAG T GAG AT T GG C TAAGG AAAAAG C T T C AAAAG T T G T 7500 

CGGTGTCATGTGGGACTATGATGAAGTAGCAGCTCACACGCCCTCTAAGTCTGCTAAGTC 7560 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

CGGTGTCATGTGGGACTATGATGAAGTAGCAGCTCACACGCCCTCTAAGTCTGCTAAGTC 7560 

CCACATCACTGGCCTTCGGGGCACTGATGTTCGTTCTGGAGCAGCCCGCAAGGCTGTTCT 7 620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

CCACATCACTGGCCTTCGGGGCACTGATGTTCGTTCTGGAGCAGCCCGCAAGGCTGTTCT 7620 

GGACTTGCAGAAGTGTGTCGAGGCAGGTGAGATACCGAGTCATTATCGGCAAACTGTGAT 7 680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

GGACTTGCAGAAGTGTGTCGAGGCAGGTGAGATACCGAGTCATTATCGGCAAACTGTGAT 7 680 

AGTTCCAAAGGAGGAGGTCTTCGTGAAGACCCCCCAGAAACCAACAAAGAAACCCCCAAG 774 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AG T T CC AAAG GAG G AGG T C T T CG T G AAG AC CCC C C AG AAAC C AAC AAAG AAAC C C C C AAG 77 4 0 

GC T TAT CTCGTACCCC C ACC T T G AAAT GAG AT G T G T T GAG AAG AT G T AC T AC GGTCAGGT 7800 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

GCTTATCTCGTACCCCCACCTTGAAATGAGATGTGTTGAGAAGATGTACTACGGTCAGGT 7800 

TGCTCCTGACGTAGTTAAAGCTGTCATGGGAGATGCGTACGGGTTTGTAGATCCACGTAC 7860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I I I I I 

TGCTCCTGACGTAGTTAAAGCTGTCATGGGAGATGCGTACGGGTTTGTCGACCCACGTAC 7860 

CCGTGTCAAGCGTCTGTTGTCGATGTGGTCACCCGATGCAGTCGGAGCCACATGCGATAC 7 920 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCGTGTCAAGCGTCTGTTGTCGATGTGGTCACCCGATGCAGTCGGAGCCACATGCGATAC 7 920 

AGTGTGTTTTGACAGTACCATCACACCCGAGGATATCATGGTGGAGACAGACATCTACTC 7 980 
I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGTGTGTTTTGACAGTACCATCACACCCGAGGATATCATGGTGGAGACAGACATCTACTC 7 980 

AGCAGCTAAACTCAGTGACCAACACCGAGCTGGCATTCACACCATTGCGAGGCAGTTATA 804 0 

1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

AGCAGCTAAACTCAGTGACCAACACCGAGCTGGCATTCACACCATTGCGAGGCAGTTATA 804 0 

CGCTGGAGGACCGATGATCGCTTATGATGGCCGAGAGATCGGATATCGTAGGTGTAGGTC 8100 
I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I II I I I 

CGCTGGAGGACCGATGATCGCTTATGATGGCCGAGAGATCGGATATCGTAGGTGTAGGTC 8100 

TTCCGGCGTCTATACTACCTCAAGTTCCAACAGTTTGACCTGCTGGCTGAAGGTAAATGC 8160 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 

TTCCGGCGTCTATACTACCTCAAGTTCCAACAGTTTGACCTGCTGGCTGAAGGTAAATGC 8160 

TGCAGCCGAACAGGCTGGCATGAAGAACCCTCGCTTCCTTATTTGCGGCGATGATTGCAC 8220 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGCAGCCGAACAGGCTGGCATGAAGAACCCTCGCTTCCTTATTTGCGGCGATGATTGCAC 8220 

CGTAATTTGGAAGAGCGCCGGAGCAGATGCAGACAAACAAGCAATGCGTGTCTTTGCTAG 8280 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I l-l I I I I I I I I I I I I I I I I I I I I I I I I 
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Sbjct 8221 CGTAATTTGGAAGAGCGCCGGAGCAGATGCAGACAAACAAGCAATGCGTGTCTTTGCTAG 8280 



Sbjct 


8221 


Query 


8281 


Sbjct 


8281 


Query 


8341 


Sbjct 


8341 


Query 


8401 


Sbjct 


8401 


Query 


8461 


Sbjct 


8461 


Query 


8521 


Sbj ct 


8521 


Query 


8581 


Sbjct 


8581 


Query 


8641 


Sbj ct 


8641 


Query 


8701 


Sbjct 


8701 


Query 


8761 


Sbjct 


8761 


Query 


8821 


Sbjct 


8821 


Query 


8881 


Sbj ct 


8881 


Query 


8941 


Sbj ct 


8941 


Query 


9001 


Sbjct 


9001 


Query 


9061 


Sbjct 


9061 


Query 


9117 



CTGGATGAAGGTGATGGGTGCACCACAAGATTGTGTGCCTCAACCCAAATACAGTTTGGA 
I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I 
CTGGATGAAGGTGATGGGTGCACCACAAGATTGTGTGCCTCAACCCAAATACAGTTTGGA 

AGAATTAACATCATGCTCATCAAATGTTACCTCTGGAATTACCAAAAGTGGCAAGCCTTA 

i 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AGAATTAACATCATGCTCATCAAATGTTACCTCTGGAATTACCAAAAGTGGCAAGCCTTA 

CTACTTTCTTACAAGAGATCCTCGTATCCCCCTTGGCAGGTGCTCTGCCGAGGGTCTGGG 
I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTACTTTCTTACAAGAGATCCTCGTATCCCCCTTGGCAGGTGCTCTGCCGAGGGTCTGGG 

ATACAACCCCAGTGCTGCGTGGATTGGGTATCTAATACATCACTACCCATGTTTGTGGGT 
I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATACAACCCCAGTGCTGCGTGGATTGGGTATCTAATACATCACTACCCATGTTTGTGGGT 

TAGCCGTGTGTTGGCTGTCCATTTCATGGAGCAGATGCTCTTTGAGGACAAACTTCCCGA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
TAGCCGTGTGTTGGCTGTCCATTTCATGGAGCAGATGCTCTTTGAGGACAAACTTCCCGA 

GACTGTGACCTTTGACTGGTATGGGAAAAATTATACGGTGCCTGTAGAAGATCTGCCCAG 

I I I I I I I I I 1 1 I I I I I I I I I I I I I I I i I 1 1 I I I I I I I I 1 1 I I I I II I I I I I I I I I I I 1 1 I 

GACTGTGACCTTTGACTGGTATGGGAAAAATTATACGGTGCCTGTAGAAGATCTGCCCAG 

CATCATTGCTGGTGTGCACGGTATTGAGGCTTTCTCGGTGGTGCGCTACACCAACGCTGA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CATCATTGCTGGTGTGCACGGTATTGAGGCTTTCTCGGTGGTGCGCTACACCAACGCTGA 

GATCCTCAGAGTTTCCCAATCACTAACAGACATGACCATGCCCCCCCTGCGAGCCTGGCG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GATCCTCAGAGTTTCCCAATCACTAACAGACATGACCATGCCCCCCCTGCGAGCCTGGCG 

AAAGAAAGCCAGGGCGGTCCTCGCCAGCGCCAA'GAGGCGTGGCGGAGCACACGCAAAATT 
I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAAGAAAGCCAGGGCGGTCCTCGCCAGCGCCAAGAGGCGTGGCGGAGCACACGCAAAATT 

GGCTCGCTTCCTTCTCTGGCATGCTACATCTAGACCTCTACCAGATTTGGATAAGACGAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGCTCGCTTCCTTCTCTGGCATGCTACATCTAGACCTCTACCAGATTTGGATAAGACGAG 

CGTGGCTCGGTACACCACTTTCAATTATTGTGATGTTTACTCCCCGGAGGGGGATGTGTT 
I I I I I I I I I I 1 I I I I I I I I I II I I I I I I I II II I I I I I I I I I I I I II I I I I II II I I I I 
CGTGGCTC ^ \CCACTTTCAATTATTGTGATGTTTACTCCCCGGAGGGGGATGTQTT 



TATTACi- 
I I I I I I I i 
TGTTACACCAL. 




"ATTGCAGAAGTTCCTTGTGAAGTATTTGGCTGTCATTGTTTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
iATTGCAGAAGTTTCTTGTGAAGTATTTGGCTGTCATTGTTTT 



GGGCTCATTGCTGTTGGATTAGCCATCAGCTGAACCCCCAAATTCAAAATTAA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
.GGGCTCATTGCTGTTGGACTAGCCATCAGCTGAACCCCCAAATTCAAAATTAA 

CTAACAG TTTTTTTTTTTTTTTTTTTTTTTAGGGCAGCGGCAACAGGGGAGACCCC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTAACAGTTTTTTTTTTTTTTTTTTTTTTTTTTTAGGGCAGCGGCAACAGGGGAGACCCC 



8340 



8340 



8400 



8400 



8460 



8460 



8520 



8520 



8580 



8580 



8640 



8640 



8700 



8700 



8760 



8760 



8820 



8820 



8880 



8880 



8940 



8940 



9000 



9000 



9060 



9060 



9116 



9120 



GGGCTTAACGACCCCGC 
I I I I I I I I I I I I I I I I I 



9133 
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Blast Result 



Page 12 of 12 



Sbjct 9121 GGGCTTAACGACCCCGC 9137 



CPU time: 



0.03 user sees. 



0.01 sys. sees 



0.04 total sees. 



Lambda 



K 



H 



1.33 



0. 621 



1.12 



Gapped 
Lambda 



K 



H 



1.33 



0.621 



1.12 



Matrix: blastn matrix: 1 -2 

Gap Penalties: Existence.: 5, Extension: 2 

Number of Sequences: 1 

Number of Hits to DB: 4626 

Number of extensions: 85 

Number of successful extensions: 19 

Number of sequences better than 10.0: 1 

Number of HSP f s gapped: 1 

Number of HSP's successfully gapped: 1 

Length of query: 9399 

Length of database: 17,071,139,809 

■Length adjustment: 28 

Effective length of query: 9371 

Effective length of database: 17,071,139,781 

Effective search space: 159973650887751 

Effective search space used: 159973650887751 

XI: 11 (21.1 bits) 

X2: 26 (50.0 bits) 

X3: 26 (50.0 bits) 

SI: 16 (31.5 bits) 

S2: 23 (44.9 bits) 



http ://www.ncbi.n^ 
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EXHIBIT 2 



Sequence Alignment 
NIH vs. Traboni 



NIH 1 
Trabonil 
NIH 61 
Traboni61 
NIH 121 
Trabonil21 
NIH 181 
Trabonil81 
NIH 241 
Traboni241 



AGTTTGGCGACCATGGTGGATCAGAACCGTTTCGGGTGAAGCCATGGTCTGAAGGGGATG 60 

I 1 I I I I I I I I I I I 1 II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGTTTGGCGACCATGGTGGATCAGAACCGTTTCGGGTGAAGCCATGGTCTGAAGGGGATG 60 

ACGTCCCTTCTGGCTCATCCACAAAAACCGTCTCGGGTGGGTGAGGAGTCCTGGCTGTGT 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACGTCCCTTCTGGCTCATCCACAAAAACCGTCTCGGGTGGGTGAGGAGTCCTGGCTGTGT 120 

GGGAAGCAGTCAGTATAATTCCCGTCGTGTGTGGTGACGCCTCACGACGTATTTGTCCGC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 1 I I I I I I I I I I I I I I I I I I I I II I I I I I I 
GGGAAGCAGTCAGTATAATTCCCGTCGTGTGTGGTGACGCCTCACGACGTACTTGTCCGC 180 

TGTGCAGAGCGTAGTACCAAGGGCTGCACCCCGGTTTTTGTTCCAAGCGGAGGGCAACCC 240 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TGTGCAGAGCGTAGTACCAAGGGCTGCACCCCGGTTTTTGTTCCAAGCGGAGGGCAACCC 24 0 

CCGCTTGGAATTAAAAACT 259 

I I I I I I I I I I I I I I I I I I I 

CCGCTTGGAATTAAAAACT 259 



NIH vs. Martin 



NIH 


1 


Martin 


1 


NIH 


61 


Martin 


61 


NIH 


121 


Martin 


121 


NIH 


181 


Martin 


181 


NIH 


241 


Martin 


241 



AGTTTGGCGACCATGGTGGATCAGAACCGTTTCGGGTGAAGCCATGGTCTGAAGGGGATG 60 

I I I II I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGTTTG-CGACCATGGTGGATCAGAACCGTTTCGGGTGAAGCCATGGTCTGAAGGGGATG 60 

ACGTCCCTTCTGGCTCATCCACAAAAACCGTCTCGGGTGGGTGAGGAGTCCTGGCTGTGT 120 

I I I I ! I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ACGTCCCTTCTGGCTCATCCACAAAAACCGTCTCGGGTGGGTGAGGAGTCCTGGCTGTGT 120 

GGGAAGCAGTCAGTATAATTCCCGTCGTGTGTGGTGACGCCTCACGACGTATTTGTCCGC 180 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
GGGAAGCAGTCAGTATAATTCCCGTCGTGTGTGGTGACGCCTCACGACGTATTTGTCCGC 180 

TGTGCAGAGCGTAGTACCAAGGGCTGCACCCCGGTTTTTGTTCCAAGCGGAGGGCAACCC 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
TGTGCAGAGCGTAGTACCAAGGGCTGCACCCCGGTTTTTGTTCCAAGCGGAGGGCAACCC 240 

CCGCTTGGAATTAAAAACT 25 9 
I I I I I I I I I I I I I I I I I I I 
CCGCTTGGAATTAAAAACTG 2 60 



2404911 
022806 



